На страницу третьего семестра

Поиск сходных нуклеотидных последовательностей, не кодирующих белки

    1. Определение транспортной РНК, участвовавшей в присоединении 4-го аминокислотного остатка к растущей цепи белка GLMU_ECOLI.

      Результат работы представлен в таблице:

     Аминокислотный остаток в 4-ой позиции белка CYNS_ECOLI S
      Соответствующий кодон в гене cynS 5'-UCA-3'
      Идеальный антикодон 5'-UGA-3'
      Сколько можно было бы ожидать разных тРНК для остатка S, если опираться на генетический код? 6
      Сколько разных тРНК для остатка S аннотировано в геноме кишечной палочки? 4
      Характеристика выбранной для дальнейшего изучения тРНК:
          имя гена serT
          локализация гена в геноме locus_tag="b0971", 1030848..1030935
          распознаваемый кодон UCD
          антикодон UGA

    Результат поиска всех сериновых тРНК у Escherichia coli K-12
    (преформатированный текст из файла с результатом поиска)

    FT                   /note="codons recognized: UCY; anticodon: GGA serine tRNA5;
    FT                   /note="codons recognized: UCD; anticodon: UGA serine tRNA1;
    FT                   /note="codons recognized: UCY; anticodon: GGA serine tRNA5;
    FT                   /note="codon recognized: UCG; anticodon: CGA serine tRNA2;
    FT                   /note="codons recognized: AGY; anticodon: GCU serine tRNA3;

    Использованные команды:

    1.grep codon.*serine ecoli.embl >codon.txt

    2.seqret ecoli.embl -sask

    Получен файл с последовательностью тРНК (в качестве параментров указывались координаты и имя выходного файла).

  1. Поиск гомологичных тРНК в родственном геноме
  2. Задача — найти в геноме Bacillus subtilis последовательность, наиболее похожую на последовательность тРНК из E.coli, выбранную в упр. 1. Поиск надо провести с помощью 4-х разных программ для быстрого поиска сходных нуклеотидных последовательностей.

    Таблица 2. Поиск гомологичной т-РНК

    Программа FASTA BLASTN MegaBLAST discontiguous MegaBLAST
    Длина якоря 6 нуклеотидов 11 нуклеотидов 28 нуклеотидов 11-12 нуклеотидов
    Результаты поиска        
    Число находок с E-value < 0,01 одна находка нет подходящих находок. наименьший е=0.06 нет находок нет подходящих находок, всего одна с е=0.06
    Характеристика лучшей находки:
          E-value 2.6e-6 0.06 - 0.06
          длина выравнивания 93 24 - 24
          вес выравнивания 174.8 32.2 - 32.2
          координаты в геноме 22290-22382 3171811-3171788(complement) - 3171811-3171788(complement)
    Аннотация лучшей находки по записи EMBL:
          имя гена trnSL-Ser1 - - -
          это тРНК? да - - -
          это тоже <сериновая> тРНК? да - - -

    Использованные команды:

    1. formatdb -i bs_genome.fasta -n bs -p F

      Были получены три индексных файла (bs.nhr, bs.nsq, bs.nin), составляющих мини-банк данных.

    2. blastall -p blastn -d bs -i UCD.fasta -o resultUCD.txt

      Получен файл с одной находкой, причем e-value слишком высокий и не подходит для исследования.

    3. megablast -d bs -i UCD.fasta -D 2 -o megablast.txt

      Получен файл, не содержащий находок.

      
          
    4. megablast -d bs -i UCD.fasta -D 2 -N 1 -W 11 -t 21 -o dicmegablast.txt
      Получен файл с одной находкой, аналогичной находки из BLASTN
    5. fasta34 UCD.fasta bs_genome.fasta 6
          

      Длина якоря - 6. Входные файлы были указаны в командной строке, поэтому нужно было ответить на четыре вопроса: сколько находок показать, показать ли ещё, отображать ли выравнивания и сколько. Получен файл с 4 находками и одним единственным значимым выравниванием.

    Сранение эффективности использованных программ. В данном случае, наиболее эффективной оказалась программа FASTA, при небольшой длине якоря, она способна найти сходство на небольших участках последовательностей. Также в данном случае, BLASTN и discontiguous MegaBLAST показали одинаковый результат. Это скорее всего связано с похожими параметрами и длиной якоря. MegaBLAST не обнаружил ни одной находки, длина якоря в этой программе 28 нуклеотидов, таким образом у программы слишком высокий критерий поиска, и для нашей задачи это не подходит.